提供者:卢梦依
下载地址:http://statmt.org/wmt18/translation-task.html#download
简介
数据集概述
该数据集包含四种欧洲语言的训练数据。可用于改进当前的翻译方法。有以下语言互译可供参考:
- 英汉和汉英
- 英语 - 捷克语和捷克语 - 英语
- 英语 - 爱沙尼亚语和爱沙尼亚语 - 英语
- 英语 - 芬兰语和芬兰语 - 英语
- 英语 - 德语和德语 - 英语
- 英语 - 哈萨克语和哈萨克语 - 英语
- 英文 - 俄文和俄文 - 英文
- 英语 - 土耳其语和土耳其语 - 英语
文件大小
约15 GB
数量
约30,000,000个句子及其翻译
相关论文
1.Gehring J, Auli M, Grangier D, et al. Convolutional Sequence to Sequence Learning[J]. 2017.
2.Wu Y, Schuster M, Chen Z, et al. Google’s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation[J]. 2016..
3.Luong M T, Manning C D. Achieving Open Vocabulary Neural Machine Translation with Hybrid Word-Character Models[J]. 2016:1054-1063.
4.Lee J, Cho K, Hofmann T. Fully Character-Level Neural Machine Translation without Explicit Segmentation[J]. 2016.
5.Chung J, Cho K, Bengio Y. A Character-Level Decoder without Explicit Segmentation for Neural Machine Translation[J]. 2016.
6.Firat O, Cho K, Bengio Y. Multi-Way, Multilingual Neural Machine Translation with a Shared Attention Mechanism[J]. 2016:866-875.